In [ ]:

    
epochs = 50

Part 7 - 使用FederatedDataset进行联邦学习

在这里，我们介绍了一种使用联合数据集的新工具。我们创建了一个FederatedDataset类，该类旨在像PyTorch Dataset类一样使用，并提供给联合数据加载器FederatedDataLoader，它将以联合方式对其进行迭代。

作者:

Andrew Trask - Twitter: @iamtrask
Théo Ryffel - GitHub: @LaRiffle

中文版译者：

Hou Wei - github：@dljgs1

我们使用上上节课提到的沙箱



In [ ]:

    
import torch as th
import syft as sy
sy.create_sandbox(globals(), verbose=False)

找一个数据集



In [ ]:

    
boston_data = grid.search("#boston", "#data")
boston_target = grid.search("#boston", "#target")

加载模型和优化器



In [ ]:

    
n_features = boston_data['alice'][0].shape[1]
n_targets = 1

model = th.nn.Linear(n_features, n_targets)

在这里，我们将获取的数据转换为FederatedDataset中的数据。看看拥有部分数据的工作机。 Here we cast the data fetched in a FederatedDataset. See the workers which hold part of the data.



In [ ]:

    
# 将结果转换为BaseDatasets
datasets = []
for worker in boston_data.keys():
    dataset = sy.BaseDataset(boston_data[worker][0], boston_target[worker][0])
    datasets.append(dataset)

# 建立FederatedDataset对象
dataset = sy.FederatedDataset(datasets)
print(dataset.workers)
optimizers = {}
for worker in dataset.workers:
    optimizers[worker] = th.optim.Adam(params=model.parameters(),lr=1e-2)

放入一个FederatedDataLoader并进行设置



In [ ]:

    
train_loader = sy.FederatedDataLoader(dataset, batch_size=32, shuffle=False, drop_last=False)

最后，我们在各个epoch进行迭代。您会发现这与纯本地PyTorch训练相比有多相似！



In [ ]:

    
for epoch in range(1, epochs + 1):
    loss_accum = 0
    for batch_idx, (data, target) in enumerate(train_loader):
        model.send(data.location)
        
        optimizer = optimizers[data.location.id]
        optimizer.zero_grad()
        pred = model(data)
        loss = ((pred.view(-1) - target)**2).mean()
        loss.backward()
        optimizer.step()
        
        model.get()
        loss = loss.get()
        
        loss_accum += float(loss)
        
        if batch_idx % 8 == 0:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tBatch loss: {:.6f}'.format(
                epoch, batch_idx, len(train_loader),
                       100. * batch_idx / len(train_loader), loss.item()))            
            
    print('Total loss', loss_accum)

恭喜!!! 是时候加入社区了!

祝贺您完成本笔记本教程！如果您喜欢此方法，并希望加入保护隐私、去中心化AI和AI供应链（数据）所有权的运动，则可以通过以下方式做到这一点！

给 PySyft 加星

帮助我们的社区的最简单方法是仅通过给GitHub存储库加注星标！这有助于提高人们对我们正在构建的出色工具的认识。

Star PySyft

加入我们的 Slack!

保持最新进展的最佳方法是加入我们的社区！您可以通过填写以下表格来做到这一点http://slack.openmined.org

加入代码项目!

对我们的社区做出贡献的最好方法是成为代码贡献者！您随时可以转到PySyft GitHub的Issue页面并过滤“projects”。这将向您显示所有概述，选择您可以加入的项目！如果您不想加入项目，但是想做一些编码，则还可以通过搜索标记为“good first issue”的GitHub问题来寻找更多的“一次性”微型项目。

捐赠

如果您没有时间为我们的代码库做贡献，但仍想提供支持，那么您也可以成为Open Collective的支持者。所有捐款都将用于我们的网络托管和其他社区支出，例如黑客马拉松和聚会！

OpenMined's Open Collective Page



In [ ]: